Задача 1. Использование PCA и t-SNE для визуализации набора данных MNIST. Ниже пример использования PCA для целого набора данных и t-SNE для его небольшой части. От Вас требуется всего лишь повторить последний пример, но для большего набора данных.

Загрузим набор MNIST. Поскольку мы собираемся использовать PCA для визуализации, оставим только две главные компоненты.

Построим данные.

Теперь используем t-SNE для этой же цели. Поскольку t-SNE очень вычислительно затратный метод, разобъем наш набор из 70000 изображений на наборы поменьше. Это можно сделать например с помощью двух вызовов функции train_test_split.

Далее я возьму самый маленький набор, а Вы позже возьмите набор побольше, чтобы успеть выпить кофе.

Неплохо в сравнении с PCA даже для такого небольшого набора, а если взять больше точек, то результат того стоит.

Задача 2. Определите номер варианта - найдите число букв в Вашей фамилии, поделите его на 4, возьмите остаток от деления и прибавьте 1.

Пример:

Иванов - 6 букв, 6%4+1=2+1=3.

Изучите встроенные в sklearn игрушечные датасеты. https://scikit-learn.org/stable/datasets/index.html

1) Boston house prices dataset

2) Diabetes dataset

3) Wine recognition dataset

4) Breast cancer wisconsin (diagnostic) dataset

Для датасета, согласно своему варианту, сделайте следующее:

1) Загрузите его.

2) Используйте 3 любых изученных нами метода машинного обучения для решения задачи регрессии/классификации Ваших данных.

3) Используйте изученные методы (решетчатый поиск, перекрестную проверку) для поиска наилучших параметров Ваших моделей.